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微 博 作 为 新 媒体 时 代 的 网 络 社交 平台 ， 
具有 互动 性 、 公 开 性 、 便 捷 性 等 优点 "4 a 
千 万 网 民 的 喜爱 ， 发 展 迅 速 。 同 时 微 博 平台 因 
其 短小 而 丰厚 、 平 等 而 互动 、 快 速 而 价 优等 优 
势 握 也 得 到 众多 企业 青睐 ， 其 中 就 包括 影视 企 
业 。《2018 年 度 微 博 电影 白皮书 》 报 告 显示 ， 
2018 年 82 部 票房 过 亿 的 电影 ，100% 开通 了 
官方 微 博 ， 全 年 累计 电影 阅读 点 评 总 量 达 568 
亿 品 。 事 实数 据说 明 微 博 平 台 拥 有 海量 的 用 户 
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同样 正成 为 影视 企业 进行 产品 营销 的 重要 平台 
Am a J 一个 重要 衡量 指标 是 
微 博 的 互动 效果 四， 即 微 博 所 引发 用 户 的 点 赞 、 
转发 和 评论 的 数量 ， 故 分 析 电 影 微 博 互动 效果 
的 影响 因素 是 重要 上 且 有 意义 的 。 影 响 微 博 互动 
效果 的 因素 有 很 多 ， 其中， 微 博 主题 是 一 个 较 
难 获 取 和 分 析 的 因素 ， 而 用 户 往往 对 关注 度 高 
的 主题 有 更 强 的 互动 意愿 。 鉴 于 此 ， 本 文 尝试 
找 出 电影 微 博 中 的 隐藏 主题 及 其 对 互动 效果 影 
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响 的 一 种 方法 。 基 于 研究 发 现 ， 为 各 影视 企业 
进行 微 博 营 销 提供 实践 指导 。 
@ 文 献 综述 

关于 影响 微 博 互 动 效果 的 探究 , 席 林 娜 等 外 
从 情感 、 时 间 线 、 粉 丝 数 等 方面 研究 影响 微 博 
互动 效果 的 因素 ， 结 果 表 明 情 感 和 粉丝 数 对 微 
博 的 互动 效果 影响 显著 ， 而 时 间 线 对 微 博 的 互 
动 效果 影响 不 显著 ; RWG | 结合 “理性 行为 ” 
原理 探究 微 博 中 用 户 参 与 互动 的 原因 ， 研 究 发 
现 微 博 用 户 的 兴趣 、 个 人 影响 力 、 微 博 活跃 程 
度 等 显著 影响 互动 效果 ， 而 微 博文 本 的 表达 形 
式 对 互动 效果 影响 不 明显 ; EE O DO 
用 户 的 粉丝 数量 正 向 影响 互动 效果 ， 并 根据 这 
种 关系 得 出 使 某 一 微 博 的 互动 效果 达到 一 定 程 
度 的 最 佳 粉丝 数量 ; 周 庆 山 等 允 将 微 博 中 的 精 
英 用 户 分 为 : 商业 明星 、 娱 乐 明 星 和 文化 明星 ， 
探究 他 们 是 否 对 用 户 的 互动 意愿 产生 不 同 的 影 
响 ， 结 果 表 明 娱 乐 明 星 引 起 用 户 的 互动 意愿 最 
强烈 ， 其 次 是 商业 明星 ， 最 后 是 文化 明星 ; 陈 
娟 等 外 基于 政务 微 博 数 据 ， 以 转发 和 评论 数 作 
为 微 博 互 动 效 果 的 测量 指标 ， 探 究 影 响 辟 谣 微 
博 互动 效果 的 因素 ， 结 果 发 现 谣言 的 方式 和 类 
型 、 微 博 的 原创 性 、 图 片 的 数量 、 微 博 的 互动 
意愿 等 对 互动 效果 有 显著 影响 ; 魏 萌 等 以 点 
赞 数 和 转发 数 作为 互动 效果 的 测量 指标 ， 探 究 
“网 红 ” 微 博 内 容 的 特征 及 其 对 互动 效果 的 影响 ， 
结果 表明 不 同类 型 的 “网 红 ” 的 受 欢迎 程度 不 同 ， 
且 微 博 内 容 在 互动 性 、 丰 富 性 、 娱 乐 性 和 生动 
性 上 明显 不 同 ; S. Wu il J. M. Hofman 4" 研 
究 了 Twitter 上 不 同 用 户 所 发 布 微 博 的 互动 程度 ， 
将 Twitter 用 户 分 为 2 个 等 级 : 一 般 用 户 与 精英 
用 户 ， 研 究 表明 精英 用 户 所 发 布 的 微 博 更 容易 
引起 其 他 用 户 的 互动 ; M. Cha 和 下 . Benevenuto 
等 趾 在 探究 Twitter 中 信息 的 流行 时 发 现 已 经 
认证 过 的 博 主 所 发 布 的 文章 更 容易 引起 转发 ; 
L. Zhanglun 和 T. Q. Pengtaiquan 等 " 在 探究 影 
响 微 博 互动 效果 的 因素 时 发 现 文本 长 度 对 互动 
效果 的 影响 显著 ， 即 较 长 微 博 文本 能 够 促进 传 


284 


ChinaXiv 合 作 期 刊 


播 的 广度 和 速度 ; J. So 和 A.Prestin 等 5 以 转 
发 数 作为 微 博 的 互动 效果 的 评测 指标 ， 探 究 了 
肥胖 在 Twitter 中 的 普遍 观念 和 态度 ， 结 果 表 明 
贬损 内 容 比 非 贬 损 能 够 更 能 引起 用 户 的 转发 与 
关注 ， 且 具有 幽默 性 的 微 博 内 容 也 容易 引起 用 
户 的 转发 与 关注 ; A. Soboleva 和 S. Burton 等 U 
用 转发 数 作 为 微 博 的 互动 效果 的 评测 指标 ， 分 
析 了 影响 转发 数 的 关键 因素 ， 结 果 表 明 账 号 的 
使 用 时 长 、 好 友 数 量 以 及 博 主 的 粉丝 数量 影响 
转发 数 ， 而 微 博 文本 中 的 标签 和 URL 超 链接 对 
转发 数 的 影响 不 显著 。 

从 国内 外 研究 现状 上 来 看 ， 学 者 们 主要 
以 微 博 的 转发 、 评 论 等 数据 作为 互动 效果 的 
测量 指标 ， 围 绕 信 源 、 信 息 内 容 和 信息 接收 
者 等 方面 探究 微 博 互动 效果 的 影响 因素 ， 而 
从 信息 内 容 维 度 出 发 探索 微 博 互 动 效 果 的 影 
响 因 素 时 ， 多 从 内 容 的 组 成 形式 和 内 容 情感 
等 方面 进行 探究 ， 鲜 有 人 探究 微 博 内 容 中 的 
隐藏 主题 对 互动 效果 的 有 影响。 对 于 电影 微 博 
领域 ， 更 是 少 有 研究 探讨 主题 对 微 博 互动 效 
果 的 有 影响。 为 了 弥补 上 述 缺 陷 ， 本 文 尝试 找 
出 电影 微 博 中 的 隐藏 主题 及 其 对 互动 效果 影 
响 的 一 种 方法 。 基 于 研究 发 现 ， 为 各 影视 企 
业 进 行 微 博 营销 提供 实践 指导 。 


影响 电影 微 博 互 动 效果 隐藏 主题 
的 研究 方法 

本 文 尝试 结合 LDA 和 多 层 回 归 模型 探究 电 
影 微 博 中 的 隐藏 主题 及 其 对 互动 效果 的 影响 。 
LDA 模型 是 一 种 常见 的 主题 模型 ， 能 够 有 效 识 
别 短文 本 数据 中 的 隐藏 主 题 ""， 而 多 层 回归 模 
型 能 够 分 析 多 个 层级 的 影响 因素 对 互动 效果 的 
we, 
2.1 LDA 

LDA 是 一 种 词 袋 模型 ， 假 设 一 篇 文档 由 一 
组 词组 成 ， 词 和 词 之 间 没有 先后 关系 ,文档 中 
潜在 的 主题 将 词 和 文档 关联 起 来 ， 即 一 个 文档 
由 一 组 不 同 概率 的 主题 组 成 ， 一 个 主题 由 一 组 
不 同 概率 的 词组 成 。 在 LDA 中 ,文档 中 的 词 是 
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已 知 的 ， 主 题 是 未 知 的 ， 根 据 已 知 的 词 和 文本 
的 生成 规则 ，LDA 通过 概率 推测 来 完成 参数 佑 
计 。LDA 生成 文本 的 规则 如 下 : 

抽取 文档 d 中 所 有 主题 的 分 布 关 系 Or 
Dir(a), Dir(a) 是 参数 为 a 的 Dirichlet 分 布 ，09, 
是 文档 - 主题 的 Multinomial 分 布 ; 

抽取 一 个 具体 的 主题 Zan~ O33 

抽取 主题 ,中 所 有 词 的 分 布 关 系 Oe 
Dir(B), Dir(B) 是 参数 为 有 的 Dirichlet 分 布 ， 9 
是 主题 - 词 的 Multinomial 分 布 ; 

抽取 一 个 具体 的 词 ww~ Pro 

重复 上 述 步 又 ,不 断 迭 代 直 到 最 终 形 成 文 
档 。 大 文档 集中 一 共有 了 个 主题 ， 则 各 个 主题 
在 文档 d 中 的 分 布 概率 可 以 表示 为 一 个 7 了 维 问 
E, 这 个 7 维 向 量 满足 >r0,, =1。 

文档 中 词 和 主题 间 的 联合 概率 分 布 见 公式 
(1) : 


P(w, zla, B)=P(w)z, B)P(z|a)* 

[PE|A)POla)dal Pwe, 9) P(g|B)do 

其 中 w 表示 文档 中 的 词语 。 
2.2 回归 方法 

本 文 使 用 回归 分 析 来 检查 隐藏 主题 的 解释 
能 力 。 一 条 微 博 接收 到 的 转发 数量 、 点 赞 数量 、 
评论 数量 和 用 户 关注 数量 越 多 ， 表 示 其 引发 的 
互动 效果 越 强烈 。 在 微 博 平 台 上， 每 条 微 博 下 
面 显 示 有 微 博 被 用 户 转 发 、 点 赞 和 评论 的 数量 ， 
而 某 一 条 微 博 吸引 的 新 的 粉丝 数 是 不 确定 的 ， 
本 文 将 每 条 微 博 的 转发 数量 、 点 赞 数 量 和 评论 
数量 作为 衡量 电影 微 博 互动 效果 的 指标 。 

不 同 电影 微 博 的 转发 数量 、 点 赞 数量 和 评 
论 数量 存在 巨大 差异 ( 见 表 1 ) ， 可 能 会 引起 数 
据 的 较 大 波动 ， 产 生 高 异 方差 性 ， 故 本 文 在 指 
标 处 理 时 将 参考 王 林 等 人 的 处 理 方法 "利用 
自然 对 数 分 别 将 指标 进行 归 一 化 ， 意 在 减 小 数 
据 波动 和 可 能 存在 的 异 方差 性 。 最 后 对 每 一 个 
指标 进行 权重 赋值 ， 则 可 得 出 每 条 电影 微 博 互 
动 效 果 了 的 计算 方法 ， 如 公式 (2 ) 所 示 : 
Y= a,Ln(X,+1)t+a,Ln(X,+1)+a,Ln(X3+1) 公式 (2) 

其 中 部、 丈 、 不 分别 为 该 条 微 博 的 转发 数量 、 


公式 (1) 
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评论 数量 和 点 赞 数量 , wo .os 为 其 对 应 的 权重 。 

王 林 和 张 表 等 “” 研究 认为 博 主 的 粉丝 数 
量 影响 微 博 的 转发 数量 ， 故 本 文 将 指标 粉丝 数 
量 添 加 为 自 变 量 。 话题 阅读 量 是 指 在 微 博 上 以 
电影 为 中 心 形成 的 话题 被 微 博 用 户 访问 的 数量 ， 
能 够 表示 此 电影 在 微 博 用 户 中 的 欢迎 程度 。 刘 
形 等 "指出 受众 感 兴趣 的 话题 能 引起 更 多 人 的 
关注 和 评论 ， 故 本 文 添加 “话题 阅读 量 ” 为 自 


rot. 
变量 。 


为 了 确定 隐藏 主题 对 电影 微 博 互动 性 的 影 
啊 ， 本 文 构 建 了 因 变 量 相 同 、 自 变量 不 同 的 两 
个 回归 模型 。 第 一 个 回归 模型 的 自 变量 仅 包括 
用 户 粉 丝 数量 和 话题 阅读 量 ， 见 公式 (3 ) ; 第 
二 个 回归 模型 添加 了 主题 虚拟 变量 ， 即 从 LDA 
模型 中 训练 得 到 的 隐藏 主题 ， 见 公式 (4 ) 。 


Yi =p +p Fit pR ta ARG) 


Y =p; +B F, + BR, +>， BT,, + 公式 (4) 

其 中 ,表示 第 4 条 微 博 的 互动 效果 , Fy 
表示 发 布 第 4 条 微 博 的 博 主 粉丝 数量 ，R, 表示 
第 d 条 微 博 所 涉及 到 的 电影 话题 的 阅读 量 。7,， 
HE k PEREP 4 条 微 博 中 的 分 布 概率 ， 且 
k=1,2, =, K, Dalia =1。 Po HÆR, pi、 
By B. 为 回归 系数 ，sv 为 随机 扰动 因子 。 
全 方法 实现 
3.1 数据 获取 

本 文 数据 集 来 源 于 电影 票房 网 PC 端 和 新 浪 
微 博 手 机 客户 端 ， 使 用 Python WEER., Are 
从 电影 票房 网 PC 端 获取 2017 年 上 映 的 所 有 电 
影 ， 共 421 条 ， 并非 所 有 的 电影 能 够 在 微 博 上 
形成 以 “电影 名 字 ” 为 主题 的 话题 页 面 ， 故 最 
终 用 于 实验 分 析 的 电影 有 123 个 ; 其 次 以 “ 电 
影 名 字 ” 为 搜索 条 件 在 微 博 上 进行 手动 搜索 ， 
找到 电影 在 微 博 上 形成 的 话题 讨论 页 面 ， 选 择 
热门 微 博 ， 获 取 话 题 阅读 量 及 每 条 微 博 的 详情 
链接 ; 最 后 根据 微 博 详 情 链 接 获 取 每 条 微 博 的 
微 博 ID、 微 博 转 发 数量 、 微 博 点 赞 数 量 、 微 
博 评 论 数量 、 微 博文 本 以 及 博 主 的 用 户 粉 丝 数 
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E, J£26 543 条 ， 删 除 重复 及 无 用 微 博 后 ， 
最 终 用 于 实验 的 有 19 061 条 。 使 用 stata 分 析 
工具 对 息 取 的 数据 进行 描述 统计 ， 结 果 见 表 1。 
转发 、 评 论 和 点 赞 对 应 的 数量 最 小 值 都 为 0， 最 
大 值 分 别 为 12 042 061、250 387、1 032 796, 
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两 者 之 间 相 差 都 较 大 ( 标准 差 明 显 大 于 均值 )， 
且 中 位 数 明 显 偏向 最 小 值 的 一 边 。 用 户 粉 丝 
数 从 1 到 120 754 022 不 等 , 中 位 数 大 于 均值 。 
话题 阅读 量 的 最 小 值 为 114.3 万 ， 最 大 值 为 
414 000 万 。 


表 1 变量 数据 的 描述 统计 


变量 均值 标准 差 最 小 值 中 位 数 最 大 值 
转发 数量 (个 ) 2 330.21 93 216.74 0 58 12 042 061 
评论 数量 (个 ) 357.40 3 339.37 0 45 250 387 
点 赞 数量 (个 ) 1 688.75 15 723.30 0 150 1 032 796 
用 户 粉 丝 数 (个 ) 3 445 031.21 6 767 079.49 1 688 298 120 754 022 
话题 阅读 量 (万 次 ) 69 602.13 83 289.66 114.3 44 000 414 000 


3.2 数据 预 处 理 
3.2.1 微 博 文本 数据 的 预 处 理 

LDA 模型 是 词 袋 模型 ， 即 用 一 组 词 向 量 表 
示 微 博文 本 ， 而 原始 的 微 博 文本 是 由 句子 组 成 
的 ， 故 在 模型 训练 之 前 ， 使 用 Python 工具 对 微 
博文 本 进行 预 处 理 ， 处 理 方式 如 下 : DHE 
有 电影 微 博文 本 的 语料库 ; @@ 过 滤 挥 无 关 的 微 
博信 息 ， 包 括 “# 话 题名 # 格式 的 内 容 、“@ 
用 户 ” 格 式 的 内 容 和 文本 字数 小 于 一 定 值 的 微 
博文 本 ; @ 使 用 停 用 词 列表 删除 不 相关 和 不 常 
见 的 术语 (例如 “有 ”“ 将 ”“ 只 是 ”) 、 数 
字 和 特殊 字符 ; 把 意思 相近 的 词语 合并 成 同 
一 个 术语 ， 例 如 “ 笑 点 ”和 “笑料 ”被 组 合成 
“ 笑 点 ”; @@ 不 同 词性 的 词 对 主题 表达 的 贡献 
程度 不 同 ， 对 主题 表达 和 辨识 作用 最 大 的 是 名 
词 和 动词 0， 故 本 文 只 考虑 名 词 和 动词 作为 特 
征 词 ; @ 分 析 发 现 词 频 具 有 明显 的 “长 尾 特征 ”， 
即 多 数 词 出 现 较 小 的 次 数 ， 少 数 词 出 现 较 高 的 
次 数 ， 这 和 唐 晓 波 等 中 的 结论 一 致 。 本 文 使 
用 0.99 级 别 的 RemoveSparseTerms K Sx, MH ME 
所 有 文档 中 出 现 小 于 1% 的 动词 和 名 词 中， 这 
是 一 种 常见 的 做 法 ， 人 允许 研究 人 员 获 得 更 短 的 
术语 列表 和 更 多 有 用 的 信息 。 经 过 预 处 理 ， 最 
AHF LDA 训练 的 词语 有 393 个 ,使 用 Python 
的 wordcloud 库 绘制 了 电影 微 博 文本 词 频 的 词 云 
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图 ， 如 图 1 所 示 : 


众 好 看 Ati 
会 


图 1 电影 微 博文 本 词 频 的 词 云 


3.2.2 变量 的 预 处 理 

使 用 Python 工具 对 变量 进行 预 处 理 ， 
处 理 方式 如 下 : 将 所 有 变量 进行 归 一 化 ， 第 
i 条 微 博 的 第 j 个 变量 表示 为 x;)， 标 准 化 后 的 

x; —min(x,) 

max(x,)—min(x,), HP min(%) 表示 变量 
的 最 小 值 , maxx) 表示 变量 % 的 最 大 值 , 庆 1, 2..., 
5, i=1, 2..., n; 

本 文 使 用 信息 炉 计算 转发 、 评 论 和 点 赞 量 3 
个 指标 的 权重 "。 信 息 粹 是 刻画 信息 无 序 度 的 
一 个 指标 ， 焙 值 越 大 ， 表 示 信 息 的 无 序 化 程度 
越 高 ， 相 对 应 的 信息 效率 越 高 ”。 计 算 变 量 转 


K 
Xj 
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BBC. PHOBIA BCE EI : 


| n Pi = 
e; = —ln(n) i In p,, i1% , 得 出 
ei=0.992 2 、e)=0.994 2 e,=0.989 7。 
l-e, 
a; = 

计算 各 变量 的 权重 "DY l-e, 
出 a=33%、0=43%、a3=24%。 

根据 公式 (2 ) 计算 出 每 条 微 博 的 互动 效果 ， 
将 其 与 归 一 化 后 的 转发 数量 、 评 论 数量 和 点 赞 
数量 这 3 个 指标 分 别 做 相关 分 析 ， 发 现 相 关系 
数 分 别 为 0.91、0.9、0.94， 均 大 于 0.9， 说 明 权 
重 赋值 合理 。 


结果 得 
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图 3 6 个 主题 的 可 视 化 映射 
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3.3 试验 结果 
3.3.1 LDA 结果 

使 用 Python 中 的 scikit-learnLDA 包 训 练 
电影 微 博文 本 数据 。LDA 最 重要 的 组 成 部 分 
之 一 是 确定 构成 所 有 文本 的 主题 数量 ， 本 文 
使 用 perplexity 指标 中 来 确定 微 博文 本 的 最 
佳 主题 数量 ,测试 主题 数量 编号 从 2 到 15， 
结果 表明 最 佳 选择 是 6 个 主题 ， 见 图 2。 使 用 
pyLDAvis 包 来 可 视 化 主题 映射 ， 图 3 显示 6 
个 主题 都 在 自己 的 非 重 三 区 域 中 ， 这 表明 6 个 
主题 之 间 没 有 相关 性 ， 每 个 主题 都 是 独立 且 信 
EAE HY 


8 10 12 14 


图 2 主题 数 的 选择 
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LDA 的 结果 中 每 个 主题 由 一 组 词组 成 。 一 
个 好 的 主题 模型 不 仅 取决 于 模型 在 可 衡量 的 统计 
指标 中 的 表现 ， 还 取决 于 每 个 主题 的 合理 性 和 可 
解释 性 。 每 个 主题 中 的 前 15 个 主题 词 见 表 2。 
LDA 允许 一 些 词语 出 现在 多 个 主题 中 ， 例 如 ， 
词语 “导演 ”出 现在 主题 1 和 主题 6 中, 词语 “发 
布 ”出 现在 主题 2 和 主题 4 中 。 表 2 中 的 结果 显 
示 主 题 1 包含 相关 电影 人 物 介绍 方面 的 术语 ， 例 
如 “导演 ” “角色 ”“ 饰 演 ”， 因 此 本 
文 将 主题 1 命名 为 “电影 人 物 ”; 主题 2 的 主题 
词 更 可 能 描述 了 有 关 电 影 宣传 的 微 博 ， 例 如 “ 预 


uyr EI 
演员 
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主题 2 命名 为 “电影 宣传 ”; 主题 3 包含 互动 营 
销 方面 的 术语 , 例如 “转发 ” “关注 ”“ 机 会 ”“ 赠 
送 ”， 因 此 本 文 将 主题 3 命名 为 “互动 营销 ”; 
主题 4 更 可 能 是 有 关 电 影 主 题 、 情 他、 插曲 的 微 
博 ， 因 此 本 文 将 主题 4 命名 为 “电影 内 容 ”; E 
题 5 主要 包含 电影 观 后 感 及 评价 方面 的 术语 ， 例 
如 “喜欢 ”“ 支 持 ”“ 好 看 ”“ 搞 笑 ”， 因 此 本 
文 将 主题 5 命名 为 “电影 评价 ”; 主题 6 包含 电 
影 线 下 宣传 活动 方面 的 术语 ,例如 “现场 ”“ 发 
布 会 ”“ 路 演 ”“ 首 映 礼 ”， 因 此 本 文 将 主题 命 
名 为 “ 线 下 活动 ”。 审 查 文本 产生 的 所 有 6 个 不 


告 ”“ 海 报 ”“ 预 告 片 ”“ 公 映 ”， 因 此 本 文 将 同 主题 都 是 可 解释 和 合理 的 。 
表 2 每 个 主题 中 的 前 15 个 主题 词 

主题 1 主题 2 主题 3 主题 4 主题 5 主题 6 

(电影 人 物 ) (电影 宣传 ) (互动 营销 ) (电影 内 容 ) (电影 评价 ) ( 线 下 活动 ) 
导演 预告 转发 故事 喜欢 现场 
演员 版 本 微 博 爱情 感谢 发 布 会 
角色 发 布 关注 青 开心 导演 
饰演 海报 电影 票 人 类 支持 直播 
拍摄 饰演 机 会 主题 曲 朋友 首 映 
影 主演 评价 演唱 DE 采访 
片段 曝光 抽取 世界 可 爱 宣传 
故事 执导 观 影 音乐 笑 点 主创 
幕后 当期 赠送 热血 祝福 路 演 
演技 预告 好 友 人 生 荐 首 映 礼 
Ef ii 有 影院 歌曲 观众 视频 
特效 特辑 评论 发 布 剧组 活动 
动作 影片 全 国 版 本 彩蛋 主演 
镜头 公映 热 映 讲述 大 卖 粉丝 
制作 监制 影片 上 线 热 映 亮相 


3.3.2 回归 结果 

使 用 stata 分 析 工 具 对 数据 进行 回归 人 处理 ， 
结果 见 表 3。 模 型 1 中 ， 所 有 变量 的 系数 在 1% 
水 平 上 具有 显著 性 ，“ 用 户 粉 丝 数 ”和 “话题 
阅读 量 ” 的 系数 均 为 正 ， 这 表明 “用 户 粉 丝 
数 ” 和 “话题 阅读 量 ” 正 向 影响 微 博 的 互动 效 
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果 。 在 模型 2 中 ， 变量“ 用 户 粉 丝 数 ”及 “ 话 
题 阅读 量 ”的 系数 和 模型 1 中 的 结果 基本 相 
当 。 除 了 模型 1 中 的 自 变量 之 外 ， 模 型 2 还 添 
加 了 LDA 中 的 隐藏 变量 。 由 于 自 变 量 和 矩阵 蕊 
中 的 项 Tyg 满足 Tv =1， 为 了 避免 自 变 量 
间 的 多 重 共 线 性 的 产生 ， 本 文 参考 HH Yan 等 四 
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的 做 法 ,将 主题 1 从 模型 中 删除 。 对 主题 1 之 
外 的 所 有 自 变量 进行 多 重 共 线性 检验 ， 结 果 
见 表 4， 方差 脱 胀 因子 VIF 的 Mean=1.44>1, 
Max=1.75<10， 故 变量 之 间 不 存在 多 重 共 线 性 。 
模型 2 结果 显示 主题 2、 主题 3、 主题 4 和 主题 
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5 在 1% 水平 上 都 具有 统计 显著 性 ， 且 系数 均 为 
E, 表明 电影 微 博 文本 中 有 关 “ 电 影 宣传 ”“ 互 
动 营销 ”“ 电 影 内 容 ” 和 “电影 评价 ”的 主题 
正 向 影响 微 博 的 互动 效果 ， 可 能 对 微 博 的 互动 
效果 有 促进 作用 。 


表 3 回归 结果 
模型 1 模型 2 
变量 
Coef. Std. Err. z P>(z| Coef. Std. Err. z P>|z 
用 户 粉丝 数 0.2219 0.003 7 60.32 0.000 0.234 1 0.003 8 61.61 0.000 
话题 阅读 量 0.2369 0.009 1 26.05 0.000 0.2369 0.009 0 26.27 0.000 
主题 2 ( 电影 宣传 ) 0.1718 0.0545 3.15 0.002 
主题 3 ( 互动 营销 ) 1.1314 0.057 5 19.67 0.000 
主题 4( 电影 内 容 ) 0.1874 0.0578 3.24 0.001 
主题 5 ( 电影 评价 ) 0.757 3 0.058 6 12.93 0.000 
主题 6 ( 线 下 活动 ) 0.093 2 0.059 2 1.58 0.115 
4 多 重 共 线性 检验 果 表 明 6 个 主题 之 间 没 有 相关 性 ， 每 个 主题 都 
主题 变量 VIF 1/VIF 是 独特 且 信 息 丰 寅 的 。 
主题 2 1.75 0.570 259 (2 ) 构建 2 层 回归 模型 分 析 6 个 隐藏 主题 
ee ree 对 电影 微 博 互动 效果 的 影响 。 结 果 表 明 变 量 “ 用 
st, i on 户 粉 丝 数 ” 和 “话题 阅读 量 ” 正 向 影响 电影 微 
主题 5 1.63 0.613 202 poe Ao 人 hs 型 
主题 6 1.52 0.656 697 A Ey J EN 
enen 1 ie 影 内 容 ” 以 及 “电影 评价 ”对 微 博 互动 效果 影 
响 具 有 显著 性 。 
话题 阅读 量 1.02 0.983 144 4.2 营销 建议 
TW a 本 研究 结果 能 够 为 企业 开展 电影 微 博 营销 
提供 一 些 启示 和 建议 。 
总 结 与 讨论 首先 ， 回 归结 果 显 示 “ 用 户 粉丝 数 ” 和 “ 话 


4.1 总 结 

本 文通 过 结合 LDA 和 2 层 回 归 模 型 的 方法 
找 出 了 电影 微 博 中 的 隐藏 主题 及 其 对 互动 效果 
的 影响 。 本 文 研究 主要 结论 如 下 : 

(1 ) 使 用 主题 挖掘 模型 LDA 发 现 了 隐藏 
在 电影 微 博 文本 中 的 6 个 可 解释 主题 : “电影 
人 物 ” “电影 宣传 "“ 互 动 营 销 ”“ 电 影 内 容 "“ 电 
影评 价 ” 和 “ 线 下 活动 ”， 主 题 可 视 化 映射 结 


题 阅 读 量 ” 对 电影 微 博 互动 效果 影响 显著 。 微 
博大 V 往往 具有 庞大 的 粉丝 数量 ， 企 业 可 以 通 
过 与 微 博大 V 合作 ,使 电影 得 到 更 广泛 的 互动 
和 宣传 。 

其 次 ,回归 结果 同时 表明 主题 “电影 宣 
传 ”“ 互 动 营销 ”“ 电 影 内 容 ” 和 “电影 评价 ” 
正 向 影响 电影 微 博 互动 效果 。 企 业 一 方面 可 以 
在 官方 微 博 中 发 布 一 些 有 奖 转发 之 类 的 活动 以 
及 和 电影 有 关 的 歌曲 、 海 报 、 主 题 、 情 节 、 精 
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彩 片 段 ; 另 一 方面 ， 企 业 应 主动 邀请 一 些 在 微 
博 中 有 影响 力 的 人 物 观 看 电影 并 对 电影 做 出 相 
关 评 价 。 

4.3 研究 不 足 与 展望 


本 人 研究 有 一 些 限制 , 希望 未 来 能 进一步 完 


善 这 些 不 足 。 首 先 在 用 perplexity 指标 选择 最 佳 
主题 时 , 只 测试 了 主题 数 为 2-15 的 模型 困惑 度 ， 
对 主题 数 大 于 15 的 情况 没有 考虑 。 未 来 研究 可 
以 测试 更 多 主题 数 ， 挖 掘 隐藏 在 电影 微 博文 本 
中 更 细 粒 度 的 主题 。 其 次 主题 的 可 解释 性 来 自 
主观 判断 ， 未 来 将 采用 专家 调研 和 内 容 分 析 等 
技术 科学 获取 主题 的 命名 ， 以 提升 主题 的 可 解 


释 性 。 
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Research Method and Application of Hidden Themes Influencing the Interactive Effect of 
Movie Microblog 


Zhang Xinxiang Zhao Caixia 
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Abstract: [Purpose/significance] Exploring the hidden themes that affect the interactive effect of 
movie microblogging can explore the hot issues of users’ attention and provide effective marketing strategies 
for enterprises. [Method/process] This paper crawled the popular microblog of 123 movies released in 2017 
from Sina Weibo, used the topic modeling method to mine the hidden themes in the movie microblog text, 
and used the regression method to analyze the impact of hidden themes on the interactive effect of movie 
microblogging. [Results/conclusions] It turns out that there are 6 interpretable themes: movie characters, 
movie promotion, interactive marketing, movie content, movie evaluation and offline activities, of which 
4 themes of movie promotion, interactive marketing, movie content and movie evaluation have a positive 
impact on the interactive effect of movie Weibo; at the same time, it is found that the number of user fans and 
the popularity of topic discussion positively affect the interactive effect of movie Weibo. 
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